Kompariranje artimetičkih sredina: T-test i ANOVA

Predavanje V

Autor

Doc. dr Nemanja Batrićević

Prije nego počnemo sa radom, potrebno je da učitamo prethnodno instalirane R pakete koji će nam biti potrebni za rad :

setwd("put/do/radnog/foldera/")

library(readxl) # paket za čitanje baze u .xlsx formatu
library(psych) # paket za opisivanje podataka (deskriptivna statistika)
library(car) # paket za rekodiranje
library(gplots) # Paket za grafičku vizuelizaciju ANOVA testa


dem <- read_xlsx("demkat.xlsx")

Učitavanje baze podataka demkat. Baza podataka sadrži informacije o državama:

Istraživačka pitanja:

Hipoteze?

1. T-test

U situaciji u kojoj istraživač želi ispitati vezu između dvije varijable, od kojih je nezavisna varijable kategorička a zavisna intervalna, potrebno je primijeniti set odgovarajućih statističkih metoda.

Najosnovnija i često potcijenjena tehnika korišćena u ovim situacijama je T-test, koji nam daje odgovor na pitanje jesu li vrijednosti varijable statistički različite za dvije grupe obzervacija. Ovo je vrlo jednostavan test, koji se najviše koristi u eksperimentalnom okruženju, đe se ispitanici nasumično raspoređuju po tretmanu i kontrolnoj grupi. Ipak, T-testove možemo koristiti i u bilo kojem kontekstu đe imamo kategoričku varijablu sa dvije grupe (kategorije) i intervalnu varijablu koja nas zanima u pogledu moguće razlike između grupa.

Postoje razne verzije T-testa, zavisno o toga kako je studija dizajnirana: dizajn između grupa i dizajn unutar grupe. U prvom slučaju koristili bi T-test nezavisnih uzoraka, a u drugome t-test uparenih uzoraka.

Recimo da želimo znati razlikuju li se demokratije i nedemokratije po pitanju stepena ekonomskog razvoja. Ovđe nam može može poslužiti T-test nezavisnih uzoraka, jer bi u tom slučaju bili zainteresovani za razlike između dvije potpuno zasebne podgrupe u našem uzorku . Ako bi, kojim slučajem, htjeli ispitati da li postoji razlika u istoj grupi država, prije ili nakon nekog događaja (tretmana), onda bi koristili T-test uparenih uzoraka.

Kako definišemo nultu hipotezu kada koristimo T-test?

Ho: Ne postoje statistički značajne razlike u aritmetičkim sredinama između grupa. Ne postoji povezanost između nezavisne i zavisne varijable.

1.1. T-test nezavisnih uzoraka

1.1.1 Pitanje 1: Da li je tip režima povezan sa nivoom ekonomskog razvoja?

ttest1 <- t.test(gdp ~ dem_rezim, data = dem)
ttest1

    Welch Two Sample t-test

data:  gdp by dem_rezim
t = -3.0341, df = 137.3, p-value = 0.002886
alternative hypothesis: true difference in means between group No and group Yes is not equal to 0
95 percent confidence interval:
 -12244.723  -2581.948
sample estimates:
 mean in group No mean in group Yes 
         9156.049         16569.385 

Ukoliko bi htjeli iskoristi drugi način, koji znači bukvalno razdvajanje dvije datotetka u dva zasebna poduzorka, onda bi to mogli uraditi na sljedeći način:

dem_d <- subset(dem, dem_rezim == "Yes") # kreiranje poduzorka demokratskih država
dem_nd <- subset(dem, dem_rezim == "No") # kreiranje poduzorka nedemokratskih država
ttest11 <- t.test(dem_d$gdp, dem_nd$gdp)
ttest11

    Welch Two Sample t-test

data:  dem_d$gdp and dem_nd$gdp
t = 3.0341, df = 137.3, p-value = 0.002886
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  2581.948 12244.723
sample estimates:
mean of x mean of y 
16569.385  9156.049 

Iako smo isti rezultat, preferiramo korišćenje prvog metoda zbog jednostavnosti koda. Ipak, druga varijanta je korisna ukoliko radimo sa grupama podataka koji ne dolaze iz istog izvora i nijesu dio iste baze podataka, kao i u situacijama kada želimo uporediti samo dvije katerije varijable koja ima više od dvije kategorije.

U rezultatima možemo viđeti vrijednost statistike t = -3.03 i nivo pouzdanosti p-value = 0.02. To su dvije najvažnije informacije u izvodu analize. Ako je p-vrijednost t-statistike ispod određenog praga koji smo postavili (obično 0,05 ili 5%), tada možemo odbaciti nultu hipotezu i prihvatiti alternativnu hipotezu da razlika u aritmetičkim sredinama između dvije grupe država nije jednaka 0 (odnosno da postoje značajne razlike). Takođe, možemo pogledati interval povjerenja i aritmetičku sredinu za dvije grupe. U ovom slučaju jasno je da ima značajnih razlika između demokratskih i nedemokratskih država.

Interpretacija: Sa pouzdanošću od 95% možemo reći da imamo dovoljno dokaza da kažemo da postoji statistički značajna razlika u nivou ekonomskog razvoja između demokratija i nedemokratija. Smjer odnosa je pozitivan, odnosno države koje su demokratske imaju značajno veći nivo BDP-a od država koje to nijesu. Snaga odnosa je jaka, s obzirom na to da je razlika između dvije grupe, u prosjeku nešto više od 7,000 dolara.

1.1.2 Pitanje 2: Da li je rodna ravnopravnost povezana sa ekonomskim razvojem?

S obzirom na to da varijable nivo rodne ravnopravnosti ima tri kategorije (“niska”, “umjerena” i “visoka”), kako bi primijenili t-test, moramo ili rekodirati varijablu u dihotomnu ili “izvući” dvije kategorije koje želimo da uporedimo. Ukoliko, recimo, želimo da uporedimo države niske sa državama visoke rodne ravnopravnosti, to možemo uraditi na sljedeći način:

dem_nr <- subset(dem, rodna_jed == "Niska") 
dem_r <- subset(dem, rodna_jed == "Visoka") 
ttest2 <- t.test(dem_r$gdp, dem_nr$gdp)
ttest2

    Welch Two Sample t-test

data:  dem_r$gdp and dem_nr$gdp
t = 10.474, df = 44.425, p-value = 0.0000000000001397
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 24032.41 35480.38
sample estimates:
mean of x mean of y 
35507.308  5750.917 

U ovom slučaju možemo viđeti da je p-vrijednost t-statistike značajno ispod 0,05. Aritmetička sredina BDP-a među državam sa niskim nivoom rodne ravnopravnosti je u prosjeku 5,750 dolara godišnje, dok je prosjek kod država koje imaju visko nivo rodne ravnopravnosti 35,500 dolara godišnje (po glavi stanovnika). Na osnovu ovoga možemo biti sigurni da je razlika u nivou ekonomskog razvoja između dvije grupe država dovoljno velika da nije mogla nastati kao rezultat slučajnosti.

Napomena: Kada se tumači p-vrijednosti i statistička značajnost, uvijek je važno imati na umu da statistička značajnos zavisi od veličine uzorka. Što je veća veličina uzorka, to je manja standardna greška. Stoga je uvijek važno obratiti pažnju na suštinsku značajnost, a ne samo statistički.

1.1.3 Pitanje 3: Da li su manje države demokratičnije od država sa većom populacijom?

Ukoliko želimo da testiramo odnos između veličine države (mjereno u veličini populacije) i nivoa demokratije to možemo uraditi koristeći T-test, ukoliko nezavisnu varijablu svedemo na dvije kategorije. Iz tog razloga, prvo ćemo rekodirati varijablu popul tako da jedna kategorija budu države sa brojem stanovnika manjim od medijane, a druga kategorija države sa brojem stanovnika većim od medijane.

Prvo ćemo utvditi vrijednost medijane i rekodirati varijablu shodno tome:

describe(dem$popul)
   vars   n  mean     sd median trimmed   mad min    max  range skew kurtosis
X1    1 166 41.48 144.93     10   16.72 11.86 0.3 1354.1 1353.8 7.74    63.51
      se
X1 11.25
dem$popul_d <- recode(dem$popul, "0:10 = 0; 10.01:hi=1")
table(dem$popul_d)

 0  1 
84 82 
ttest3 <- t.test(nivo_dem ~ popul_d, data = dem)
ttest3

    Welch Two Sample t-test

data:  nivo_dem by popul_d
t = 1.282, df = 139.57, p-value = 0.202
alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0
95 percent confidence interval:
 -0.4307313  2.0193810
sample estimates:
mean in group 0 mean in group 1 
       6.328571        5.534247 

Na osnovu testa možemo zaključiti da iako u prosjeku manje države imaju viši nivo demokratije (6.32) u odnosu na veće države (5.53), ova razlika nije statistička značajna (p=0.202).

Da li bi dobili isti rezultat ukoliko bi drugačije definisali kategorije “malih” i “velikih” država?

1.2. T-test uparenih uzoraka

Korišćenje T-testa uparenih uzoraka u R vrši se na način veoma sličan prethodnom primjeru. Potrebno je unijetu izmjene koje se odnose na to koje varijable koristimo za grupisanje, kao i dodatni argument o tome da li da R tretira uzorke kao nezavisne ili kao uparene. To je moguće uraditi koristeći argument paired = TRUE. Kada su u pitanju anketna istraživanja, ova vrsta analize se posebno često koristi u slučaju panel studija. Jedina razlika je u tome što je potrebno kao nezavisnu varijablu specifikovati koji poduzorak je prikupljen prije a koji nakon tretmana.

#primjer kako bi uradili test uparenih uzoraka kada bi imali podatke 
#koji odgovaraju takvom metodu
ttest4 <- t.test(ZV ~ NV, data = baza, paired = TRUE)
ttest4

Razlike između jednosmjernog i dvosmjernog test-a?

2. ANOVA

Često imamo posla s intervalnom zavisnom varijablom i kategoričkom nezavisnom varijablom sa više od dvije kategorije. U tom slučaju, želimo izvršiti analizu varijanse koja će nam reći postoji li razlika između aritmetičkih sredina svih grupa. Ovaj test reći će nam da li se bilo koja od grupa bitno razlikuje od drugih, ali ne i koja. To moramo interpretirati na drugi način, nezavisno od samog statističkog testa. Slijedi jednostavna jednosmjerna analiza varijanse - sa jednom zavisnom varijablom i jednom nezavisnom varijablom.

ANOVA se implementira u R-u sa funkcijom aov(). Moramo definisati formulu i reći funkciji koju će bazu podataka koristiti.

2.1. Pitanje 4: Da li je etnička raznolikost povezana sa ekonomskom nejednakošću?

Ovaj testo možemo sprovesti koristeći ANOVA i prikazali rezultate analize funkcijom summary():

anova1 <- aov(gini ~ etn_frak, data = dem)
summary(anova1)
             Df Sum Sq Mean Sq F value Pr(>F)  
etn_frak      2    521   260.7   2.603 0.0783 .
Residuals   117  11720   100.2                 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
47 observations deleted due to missingness

Najvažnija informacija koju ovđe treba potražiti je vrijednost F i sa njom povezana vrijednost p (Pr (> F)). Ako je drugo manje od našeg praga za statističku značajnost (0.05), možemo zaključiti da postoji statistički značajna razlika između aritmetičkih sredina grupa.

U našem slučaju vrijednost je 0.078, što nam ne dopušta da odbacimo nultu hipotezu da nema razlike u aritmetičkim sredinama među kategorijama.

Rezultate možemo i vizuelno prikazati. Postoji više načina za to, ovđe je najjednostavnije koristiti funkciju plotmeans() iz paketa gplots. Funkcija koristi isti skup argumenata koji bismo koristili za funkciju aov().

Isti kod za grafičko prikazivanje možemo koristiti iza T-test.

plotmeans(gini ~ etn_frak, data = dem)

Grafik nam pokazuje aritmetičku sredinu za grupe s odgovarajućim intervalima povjerenja. Možemo vidjeti da je interval povjerenja za jednu grupu takav da se ne preklapa s intervalom pouzdanosti za druge grupe.Dakle, test pokazuje statistički značajnu razliku između grupa.

2.2. Pitanje 1: Da li je tip režima povezan sa nivoom ekonomskog razvoja?

Što ako ponovo analiziramo odnos tipa režima i ekonomskog razvoja, ali ovaj put koristeći varijablu sa više od dvije kategorije nezavisne varijable?

anova2 <- aov(gini ~ tip_rezima, data = dem)
summary(anova2)
             Df Sum Sq Mean Sq F value  Pr(>F)   
tip_rezima    3   1504   501.2   5.479 0.00147 **
Residuals   118  10794    91.5                   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
45 observations deleted due to missingness

Shodno p-vrijednosti možemo zaključiti da postoji razlika između tipa režima i nivoa ekonomske nejednakosti. Međutim, kao što smo rekli ranije, ne možemo znati samo na osnovu testa odakle ta razlika dolazi. Zato ćemo se ponovo poslužiti grafikom.

plotmeans(gini ~ tip_rezima, data = dem)

Napomena: prilikom tumačenja statističke i suštinske znalajnosti koristeći grafike, važno je obratiti pažnju na vrijednosti Y osi.

Na bazi grafika možemo zaključiti da ne postoje veće razlike između autoritarnih, hibridnih i poludemokratija. Međutim, jasno je da pune ili konsolidovane demokratije imaju značajno niži nivo ekonomske nejednakosti od drugih tipova režima i da je to kategorija koja je “odgovorna” razliku koju je test identifikovao.